机器学习(ML)研究通常集中在模型上,而最突出的数据集已用于日常的ML任务,而不考虑这些数据集对基本问题的广度,困难和忠诚。忽略数据集的基本重要性已引起了重大问题,该问题涉及现实世界中的数据级联以及数据集驱动标准的模型质量饱和,并阻碍了研究的增长。为了解决此问题,我们提出Dataperf,这是用于评估ML数据集和数据集工作算法的基准软件包。我们打算启用“数据棘轮”,其中培训集将有助于评估相同问题的测试集,反之亦然。这种反馈驱动的策略将产生一个良性的循环,该循环将加速以数据为中心的AI。MLCommons协会将维护Dataperf。
translated by 谷歌翻译
最近的研究表明,深神经网络(DNN)易受对抗性攻击的影响,包括逃避和后门(中毒)攻击。在防守方面,有密集的努力,改善了对逃避袭击的经验和可怜的稳健性;然而,对后门攻击的可稳健性仍然很大程度上是未开发的。在本文中,我们专注于认证机器学习模型稳健性,反对一般威胁模型,尤其是后门攻击。我们首先通过随机平滑技术提供统一的框架,并展示如何实例化以证明对逃避和后门攻击的鲁棒性。然后,我们提出了第一个强大的培训过程Rab,以平滑训练有素的模型,并证明其稳健性对抗后门攻击。我们派生机学习模型的稳健性突出了培训的机器学习模型,并证明我们的鲁棒性受到紧张。此外,我们表明,可以有效地训练强大的平滑模型,以适用于诸如k最近邻分类器的简单模型,并提出了一种精确的平滑训练算法,该算法消除了从这种模型的噪声分布采样采样的需要。经验上,我们对MNIST,CIFAR-10和Imagenet数据集等DNN,差异私有DNN和K-NN模型等不同机器学习(ML)型号进行了全面的实验,并为反卧系攻击提供认证稳健性的第一个基准。此外,我们在SPAMBase表格数据集上评估K-NN模型,以展示所提出的精确算法的优点。对多元化模型和数据集的综合评价既有关于普通训练时间攻击的进一步强劲学习策略的多样化模型和数据集的综合评价。
translated by 谷歌翻译
AI-based code generators are an emerging solution for automatically writing programs starting from descriptions in natural language, by using deep neural networks (Neural Machine Translation, NMT). In particular, code generators have been used for ethical hacking and offensive security testing by generating proof-of-concept attacks. Unfortunately, the evaluation of code generators still faces several issues. The current practice uses automatic metrics, which compute the textual similarity of generated code with ground-truth references. However, it is not clear what metric to use, and which metric is most suitable for specific contexts. This practical experience report analyzes a large set of output similarity metrics on offensive code generators. We apply the metrics on two state-of-the-art NMT models using two datasets containing offensive assembly and Python code with their descriptions in the English language. We compare the estimates from the automatic metrics with human evaluation and provide practical insights into their strengths and limitations.
translated by 谷歌翻译
我们介绍了深张量网络,这些网络是基于权重矩阵的张量网络表示的成倍宽的神经网络。我们评估图像分类(MNIST,FashionMnist)和序列预测(蜂窝自动机)任务的建议方法。在图像分类案例中,深度张量网络改善了我们的矩阵产品状态基线,并在MNIST上达到0.49%的错误率,而时尚人士的错误率为8.3%。在序列预测情况下,我们证明了与一层张量网络方法相比,参数数量的指数改善。在这两种情况下,我们都讨论了非均匀和均匀的张量网络模型,并表明后者可以很好地推广到不同的输入尺寸。
translated by 谷歌翻译
机器人技术中最重要的挑战之一是产生准确的轨迹并控制其动态参数,以便机器人可以执行不同的任务。提供此类运动控制的能力与此类运动的编码方式密切相关。深度学习的进步在发展动态运动原语的新方法的发展方面产生了强烈的影响。在这项工作中,我们调查了与神经动态运动原始素有关的科学文献,以补充有关动态运动原语的现有调查。
translated by 谷歌翻译
This paper presents trajectory planning for three-dimensional autonomous multi-UAV volume coverage and visual inspection based on the Heat Equation Driven Area Coverage (HEDAC) algorithm. The method designs a potential field to achieve the target density and generate trajectories using potential gradients to direct UAVs to regions of a higher potential. Collisions are prevented by implementing a distance field and correcting the agent's directional vector if the distance threshold is reached. The method is successfully tested for volume coverage and visual inspection of complex structures such as wind turbines and a bridge. For visual inspection, the algorithm is supplemented with camera direction control. A field containing the nearest distance from any point in the domain to the structure is designed and this field's gradient provides the camera orientation throughout the trajectory. The bridge inspection test case is compared with a state-of-the-art method where the HEDAC algorithm allowed more surface area to be inspected under the same conditions. The limitations of the HEDAC method are analyzed, focusing on computational efficiency and adequacy of spatial coverage to approximate the surface coverage. The proposed methodology offers flexibility in various setup parameters and is applicable to real-world inspection tasks.
translated by 谷歌翻译
主张神经符号人工智能(NESY)断言,将深度学习与象征性推理相结合将导致AI更强大,而不是本身。像深度学习一样成功,人们普遍认为,即使我们最好的深度学习系统也不是很擅长抽象推理。而且,由于推理与语言密不可分,因此具有直觉的意义,即自然语言处理(NLP)将成为NESY特别适合的候选人。我们对实施NLP实施NESY的研究进行了结构化审查,目的是回答Nesy是否确实符合其承诺的问题:推理,分布概括,解释性,学习和从小数据的可转让性以及新的推理到新的域。我们研究了知识表示的影响,例如规则和语义网络,语言结构和关系结构,以及隐式或明确的推理是否有助于更高的承诺分数。我们发现,将逻辑编译到神经网络中的系统会导致满足最NESY的目标,而其他因素(例如知识表示或神经体系结构的类型)与实现目标没有明显的相关性。我们发现在推理的定义方式上,特别是与人类级别的推理有关的许多差异,这会影响有关模型架构的决策并推动结论,这些结论在整个研究中并不总是一致的。因此,我们倡导采取更加有条不紊的方法来应用人类推理的理论以及适当的基准的发展,我们希望这可以更好地理解该领域的进步。我们在GitHub上提供数据和代码以进行进一步分析。
translated by 谷歌翻译
新一代无线技术,健身跟踪器和带嵌入式传感器的设备可能对医疗系统和生活质量产生重大影响。在这些设备中考虑的最重要方面是所产生的数据和功耗的准确性。可以监控的许多事件,而明显简单,可能无法通过配备嵌入式传感器的设备易于检测和识别,尤其是在具有低计算能力的设备上。众所周知,深度学习减少了对贡献识别不同目标类别的特征的研究。在这项工作中,我们提供了一种适用于摆动板的便携式和电池供电的微控制器。摆动板是低成本的设备,可用于传感器训练,以避免踝关节伤害或受伤后的康复过程的一部分。通过使用基于深度学习的认知技术来实施运动识别过程。为了降低功耗,我们添加了一个适应性层,它动态管理设备的硬件和软件配置,以在运行时调整到所需的操作模式。我们的实验结果表明,将节点配置调整为运行时的工作量可以节省高达60%的功耗。在自定义数据集上,我们的优化和量化的神经网络达到了大于97%的精度值,用于检测摆动板上的一些特定体育锻炼。
translated by 谷歌翻译
热方程驱动区域覆盖范围(HEDAC)是由潜在场的梯度引导的最先进的多机颈运动控制。特此实施有限元方法以获得Helmholtz部分微分方程的解决方案,该方程对测量运动控制的潜在字段进行了建模。这使我们能够调查任意形状的领域,并以优雅而健壮的方式包括Hedac的基本想法。对于简单的运动运动运动,通过将试剂运动用电位的梯度引导,可以成功处理障碍和边界避免限制。但是,包括其他约束,例如固定障碍物和移动障碍物的最小间隙距离以及最小的路径曲率半径,都需要控制算法的进一步交替。我们通过基于无碰撞逃生路线操纵的直接优化问题制定了一种相对简单但可靠的方法来处理这些约束的方法。这种方法提供了保证的避免碰撞机制,同时由于优化问题分配而在计算上是便宜的。在三个现实的测量场景模拟中评估了所提出的运动控制,显示了测量的有效性和控制算法的鲁棒性。此外,突出了由于定义不当的测量场景而引起的潜在操纵困难,我们提供了有关如何超越它们的指南。结果是有希望的,并表明了对自主测量和潜在的其他HEDAC利用的拟议受限的多代理运动控制的现实适用性。
translated by 谷歌翻译
最近已经采取了密集的算法努力来实现复杂ML模型的认证鲁棒性快速改善。但是,当前的鲁棒性认证方法只能在有限的扰动半径下进行认证。鉴于现有的纯数据驱动的统计方法已经达到了瓶颈,因此我们建议将统计ML模型与知识(以逻辑规则表示为逻辑规则)作为使用Markov Logic Networks(MLN(MLN)(以进一步提高)的推理组件,以进一步改善总体认证的鲁棒性。这为证明这种范式的鲁棒性,尤其是推理组成部分(例如MLN)开辟了新的研究问题。作为理解这些问题的第一步,我们首先证明了证明MLN鲁棒性的计算复杂性是#p-hard。在这种硬度结果的指导下,我们通过仔细分析不同的模型制度来得出第一个用于MLN的认证鲁棒性。最后,我们对五个数据集进行了广泛的实验,包括高维图像和自然语言文本,以及自然语言文本,以及我们表明,具有基于知识的逻辑推理的经认证的鲁棒性确实胜过了T。心。
translated by 谷歌翻译